Pondération et classification simultanée de données binaires et continues
نویسندگان
چکیده
Résumé. Dans cet article, nous proposons une nouvelle approche de classification topologique et de pondération des variables mixtes (qualitatives et quantitatives codées en binaire) durant un processus d’apprentissage non supervisé. Cette approche est basée sur le modèle des cartes auto-organisatrices. L’apprentissage est combiné à un mécanisme de pondération des différentes variables sous forme de poids d’influence sur la pertinence des variables. L’apprentissage des pondérations et des prototypes est réalisé d’une manière simultanée en favorisant une classification optimisée des données. L’approche proposée a été validée sur des données qualitatives codées en binaire et plusieurs bases de données mixtes.
منابع مشابه
Co-clustering de données mixtes à base des modèles de mélange
Résumé. La classification croisée (co-clustering) est une technique non supervisée qui permet d’extraire la structure sous-jacente existante entre les lignes et les colonnes d’une table de données sous forme de blocs. Plusieurs approches ont été étudiées et ont démontré leur capacité à extraire ce type de structure dans une table de données continues, binaires ou de contingence. Cependant, peu ...
متن کاملModèles de mélanges topologiques pour la classification de données catégorielles et mixtes
Résumé. Cet article présente une méthode basée sur les cartes auto-organisatrices probabilistes dédiées à la classification non supervisée et la visualisation de données catégorielles et des données mixtes contenant des composantes quantitatives et binaires. Pour chacun de ces types de données, nous proposons un formalisme probabiliste dans lequel les unités de la carte topologique sont représe...
متن کاملCaractérisation automatique des classes découvertes en classification non supervisée
Résumé. Dans cet article, nous proposons une nouvelle approche de classification et de pondération des variables durant un processus d’apprentissage non supervisé. Cette approche est basée sur le modèle des cartes auto-organisatrices. L’apprentissage de ces cartes topologiques est combiné à un mécanisme d’estimation de pertinences des différentes variables sous forme de poids d’influence sur la...
متن کاملClassification relationnelle topographique
Résumé : Ce papier présente un formalisme relationnel pour la classification topographique de données qualitatives (ou catégorielles), se présentant sous forme d’une matrice binaire ou d’une somme de matrices binaires. L’algorithme de la classification relationnelle topographique proposé s’inspire du modèle de Kohonen (conservation de l’ordre topologique) et utilise le formalisme de l’Analyse R...
متن کاملClassification d'un tableau de contingence et modèle probabiliste
Résumé. Ces dernières années, la classification croisée ou classification par blocs, c’est-à-dire la recherche simultanée d’une partition des lignes et d’une partition des colonnes d’un tableau de données, est devenue un outil très utilisé en fouille de données. Dans ce domaine, l’information se présente souvent sous forme de tableaux de contingence ou tableaux de co-occurrence croisant les mod...
متن کامل